特點
① 完全忠實於官方編碼
本碼表完全忠實於官方蒼頡檢字法碼表,不更改《內碼對照表》的編碼,即使其中存在筆誤亦然,完全體現蒼頡檢字法原貌。
② 採用 IDS 表示未收錄漢字
對於尚未收錄於 Unicode 的漢字,我們採用表意文字描述符(IDS,Ideograph Description Sequence)表示,例如:&~AABDD; 目前尚未收入 Unicode,暫以「⿱昍冧」代之。
③ 增設「全碼」欄位
除了官方的「蒼頡檢字法官方內碼」與「2003 版五代內碼」以外,我們另增二欄,以方便用戶使用:
1. 蒼頡檢字法全碼
《內碼對照表》中收錄的蒼頡檢字法編碼與 2003 版五代編碼皆為內碼,為保證唯一性,蒼頡檢字法編碼後面可能帶有數字。
碼長小於五時: 數字不會佔去編碼,例如:「已」SU1 (全碼 SU)。
碼長等於五時: 數字可能佔去編碼,例如:「𢻽」MVIY1 (全碼 MVIYE)。
此欄會參考蒼頡檢字法輔助字形和重碼情況,刪去或補足編碼,以提供完整的編碼。
2. 2003 版五代倉頡全碼
由於該項資料已於《漢文庫典》中提供,我們使用 Danny Lin @Danny0838 爬取的《漢文庫典》數據。
④ 碼表排列形式
文本化後的碼表以以下形式排列:
| 漢字或 IDS | 蒼頡檢字法官方內碼 | 蒼頡檢字法全碼 | 2003 版五代內碼 | 2003 版五代全碼 |